Juegos de Markov de suma cero para dos jugadores fuera de línea con regularización KL
<meta content=Explora los juegos de Markov de suma cero offline con regularización KL. Un enfoque teórico para problemas de decisión secuencial en ausencia de datos en línea. name=description>